課程資訊
課程名稱
資料科學與社會研究
Data Science and Social Inquiry 
開課學期
106-1 
授課對象
社會科學院  經濟學系  
授課教師
林明仁 
課號
ECON5154 
課程識別碼
323 U1200 
班次
 
學分
2.0 
全/半年
半年 
必/選修
選修 
上課時間
星期一3,4(10:20~12:10) 
上課地點
社科502 
備註
與謝吉隆合授
限學士班三年級以上 或 限碩士班以上
總人數上限:60人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/1061ECON5154_ 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

“Data science is an emerging discipline that draws upon knowledge in statistical methodology and computer science to create impactful predictions and insights?for a wide range of traditional scholarly fields.”

-Harvard Data Science Initiative

藉由社會科學各領域與資料科學互動密切研究者的分享,讓同學了解社會科學domain knowledge 在大數據研究中所能扮演的角色。並藉由初階的R語言與web crawling實作,帶領學生實際從事如何以資料科學進行對社會的探索。

社會科學家的工作即是描述、解釋、甚至預測社會現象。我們首先建構人類行為的理論,接著觀察社會並收集、分析資料,在理論與實證的不斷互動中 持續修正我們對這個世界的想像與看法。政治學、經濟學與社會學或許有不同的關心議題與切入視角,但是這個過程,一直是社會科學重要的核心方法論之一。
然而過去幾年來,由於資料運算與儲存技術的爆炸性成長,Big Data 的興起從根本上改變了社會科學家看待資料的方式! 我們不再只能依賴傳統的調查問卷, 而可以從網路或其他的資料儲存處,直接抓取人類行為的軌跡加以分析。這個改變,讓我們能觀察到人類更多面向的行為並探究其複雜性。過去幾年來,社會科學家已經在各領域利用Big Data取得不少的研究成果。本門課程邀請國內對大數據研究有心得的社會科學研究者,來跟大家分享,他們的研究,如何跟大數據擦出火花?
 

課程目標
一、 課程概述
“Data science is an emerging discipline that draws upon knowledge in statistical methodology and computer science to create impactful predictions and insights for a wide range of traditional scholarly fields.”
-Harvard Data Science Initiative
社會科學家的工作即是描述、解釋、甚至預測社會現象。我們首先建構人類行為的理論,接著觀察社會並收集、分析資料,在理論與實證的不斷互動中 持續修正我們對這個世界的想像與看法。政治學、經濟學與社會學或許有不同的關心議題與切入視角,但是這個過程,一直是社會科學重要的核心方法論之一。
然而過去幾年來,由於資料運算與儲存技術的爆炸性成長,Big Data 的興起從根本上改變了社會科學家看待資料的方式! 我們不再只能依賴傳統的調查問卷, 而可以從網路或其他的資料儲存處,直接抓取人類行為的軌跡加以分析。這個改變,讓我們能觀察到人類更多面向的行為並探究其複雜性。過去幾年來,社會科學家已經在各領域利用Big Data取得不少的研究成果。本門課程邀請國內對大數據研究有心得的社會科學研究者,來跟大家分享,他們的研究,如何跟大數據擦出火花?

二、 教學目標

藉由社會科學各領域與資料科學互動密切研究者的分享,讓同學了解社會科學domain knowledge 在大數據研究中所能扮演的角色。並藉由初階的R語言與web crawling實作,帶領學生實際從事如何以資料科學進行對社會的探索。

三、 每週進度及教學內容簡述
Week 1 (9/11): Class introduction and What is Social Inquiry? 林明仁 (台大經濟系)/謝吉隆 (台大新聞所)
Week 2 (9/18): What is Data Science? 陳昇瑋(中研院資科所)
Week 3 (9/25): R Basics 謝吉隆 (台大新聞所)
Week 4 (10/02): R Basics謝吉隆 (台大新聞所)
Week 5 (10/09): Holiday
Week 6 (10/16): Data Science in Political Science劉正山(中山政治系)
Week 7 (10/23): Data Science in Economics 陳釗而(台大經濟系)
Week 8 (10/30)Getting CSV and JSON plus XML or Accessing Database謝吉隆 (台大新聞所)
Week 9 (11/06)Getting data from Social media, e.g., facebook, twitter, flickr謝吉隆 (台大新聞所)
Week 10 (11/13) Crawling web data, e.g. ptt 謝吉隆 (台大新聞所)
Week 11 (11/20) Crawling web data, online news crawler謝吉隆 (台大新聞所)
Week 12 (11/27) Data Science in Sociology 江彥生 (中研院社會所)
Week 13 (12/04) Data Science in Psychology 黃從仁 (台大心理系)
Week 14 (12/11)Data Science in Geography 溫在弘 (台大地理系)
Week 15 (12/18)Data Science in Humanity 謝舒凱(台大語言所)
Week 16 (12/25)Presentation
Week 17 (1/01) Holiday
Week 18 (1/08) Presentation
Week 19 (1/15) Presentation


 
課程要求
評分標準
上課參與:20%(到課率、發問等)
課後作業:20%
期中報告:20% 於各主題擇一,繳交一份1000字以內的報告。報告內容須包含兩部分: 第一部份為演講主題摘要(300字以內),第二部份則選定一個主題,先定義研究問題,簡單描述所需資料變數為何,以及所採取的分析方法跟可能的結果。本份報告不需要實際收集資料與執行分析,比較像是研究主題的發想與初步草圖。

期末報告40%
三-四人一組,組內需涵蓋社科院至少三個系以上成員。報告內容須包括: (1)研究主題的定義與重要性,(2)資料取得、呈現、與分析,以及(3) 結論的可信度。
 
預期每週課後學習時數
 
Office Hours
 
指定閱讀
TBA 
參考書目
待補 
評量方式
(僅供參考)
   
課程進度
週次
日期
單元主題
第1週
9/11  Class introduction and What is Social Inquiry? 林明仁 (台大經濟系)/謝吉隆 (台大新聞所) 
第2週
9/18  What is Data Science? 陳昇瑋(中研院資科所) 
第3週
9/25  R Basics 謝吉隆 (台大新聞所) 
第4週
10/02  R Basics謝吉隆 (台大新聞所) 
第5週
10/09  Holiday 
第6週
10/16  Data Science in political Science 劉正山(中山政治系) 
第7週
10/23  Data Science in Economics陳釗而(台大經濟)  
第8週
10/30  Getting CSV and JSON plus XML or Accessing Database謝吉隆 (台大新聞所) 
第9週
11/06  Getting data from Social media, e.g., facebook, twitter, flickr謝吉隆 (台大新聞所) 
第10週
11/13  Crawling web data, e.g. ptt 謝吉隆 (台大新聞所) 
第11週
11/20  Crawling web data, online news crawler謝吉隆 (台大新聞所) 
第12週
11/27  Data Science in Sociology 江彥生 (中研院社會所) 
第13週
12/04  Data Science in Psychology 黃從仁 (台大心理系) 
第14週
12/11  Data Science in Geography 溫在弘 (台大地理系) 
第15週
12/18  Data Science in Humanity 謝舒凱(台大語言所) 
第16週
12/25  智庫驅動 謝宗震執行長 
第17週
1/01  Holiday 
第18週
期末考周之後(1/15)  Student Presentation